AI资讯新闻榜单内容搜索-Google gem

挤干大模型高分「水分」！最强模型仅49分，南大傅朝友发布Video-MME-v2

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在 Google Gemini 评测团队邀约下推出视频理解新基准 Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及 3300 + 人工时高质量标注，揭示模型与人类的巨大鸿沟（49 vs 90）、传统 Acc 指标虚高、以及 “Thinking” 并非总是增益等现象。

来自主题: AI技术研报

10949 点击 2026-04-13 15:01

南大团队直击大模型高分神话：人类90分，最强模型仅49分

现有大模型评测分数日趋饱和，但与真实体验差距显著。南京大学傅朝友团队牵头，在Google Gemini评测团队邀约下推出视频理解新基准Video-MME-v2。凭借创新的分层能力体系与组级非线性评分，以及3300+人工时高质量标注，揭示模型与人类的巨大鸿沟（49vs90）、传统Acc指标虚高、以及「Thinking」并非总是增益等现象。

来自主题: AI技术研报

8324 点击 2026-04-13 13:48

重磅！Google Gemma-4-31B 模型被彻底破解！【附越狱版下载链接】

Google 最新发布的 Gemma-4-31B 基础模型出现了越狱版本，安全限制被完全移除。这个名为"Gemma-4-31B-JANG_4M-CRACK"的模型已经公开发布在 Hugging Face 上，任何人都可以下载使用。

来自主题: AI资讯

14478 点击 2026-04-06 20:32

全球 AI 公司烧了几千亿，最后都得抢着给苹果「打工」

就在刚刚，据彭博社报道，iOS 27 将引入一套名为「Extensions」的新机制，允许用户通过设置面板，把 Google Gemini、Anthropic Claude 等第三方 AI 接入 Siri，就像现在调用 ChatGPT 一样直接从 Siri 发起请求。

来自主题: AI资讯

9004 点击 2026-03-27 14:22

20天狂更超10次，OpenClaw接入Gemini 3.1和Apple Watch

2月以来，OpenClaw（前身为Clawdbot、Moltbot）卷疯AI圈。在2月21日OpenClaw发布的最新版本中，正式接入了Google Gemini 3.1 Pro预览版，还将Discord引入实时语音与连续路由功能。

来自主题: AI资讯

11413 点击 2026-02-23 10:54

20 亿美元收 Q.ai，苹果想让你「无声」地控制 AI

在 AI 上日渐落后的苹果，最近几个月加紧了前进步伐。抛弃 OpenAI，携手 Google Gemini 后，苹果近日又有新动作。当地时间 1 月 29 日，苹果公司完成了一项近 20 亿美元的收购，目标是以色列 AI 初创公司 Q.ai。

来自主题: AI资讯

9378 点击 2026-01-30 16:17

会议软件Zoom也来搞AI了，称在AI最难考试上“击败”了Gemini 3

最近，视频会议软件公司 Zoom 发布了一条出人意料的消息：他们宣称在“人类最后的考试”（Humanity s Last Exam，简称 HLE）这个号称当前 AI 领域最具挑战性的基准测试上，取得了 48.1％的成绩，比此前由 Google Gemini 3 Pro（带工具）保持的 45.8％高出 2.3 个百分点。

来自主题: AI资讯

8777 点击 2025-12-15 17:26

深入AI Agent内核: Google gemini-cli 源码深度解构

随着大语言模型与开发工具链的深度融合，命令行终端正被重塑为开发者的AI协作界面。本文以 Google gemini-cli 为范本，通过源码解构，系统性分析其 Agent 内核、ReAct 工作流、工具调用与上下文管理等核心模块的实现原理。为希望构建终端 Agent 的开发者，提供工程实现的系统化参考。

来自主题: AI技术研报

9473 点击 2025-12-01 16:15

刚刚，Gemini Chrome正式发布了！

当地时间9月19日，上午6:02分，Google Gemini App宣布 Gemini Chrome正式面向美国所有符合条件的 Mac和 Windows用户推出，并其即将在手机端 iOS上推出。

来自主题: AI资讯

11690 点击 2025-09-19 12:04

腾讯AI Lab首创RL框架Parallel-R1，教大模型学会「并行思维」

自从 Google Gemini 将数学奥赛的成功部分归功于「并行思维」后，如何让大模型掌握这种并行探索多种推理路径的能力，成为了学界关注的焦点。

来自主题: AI技术研报

9311 点击 2025-09-18 15:04